Inférence de règles de propagation syntaxique pour l'alignement de mots

نویسندگان

  • Sylwia Ozdowska
  • Vincent Claveau
چکیده

This paper presents and evaluates an original approach to automatically align bitexts at the word level. It relies on a syntactic dependency analysis of the texts and uses a machinelearning technique, namely inductive logic programming, to automatically infer rules called propagation rules. These rules make the most of the syntactic information to precisely align words. This approach is entirely automatic, uses very few training data, and its results rival the ones of the best existing alignment systems. Moreover, syntactic isomorphisms between the two spotted languages are easily identified through the inferred rules. MOTS-CLÉS : alignement de mots, apprentissage artificiel, programmation logique inductive, analyse syntaxique

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

SPARQL Template : un langage de pretty printing pour RDF

RDF est un langage de représentation de connaissances basé sur des graphes étiquetés, conçu par le W3C pour le Web sémantique et le Web des données. En tant que langage d’échange pivot, il peut être utilisé pour représenter des arbres de syntaxe abstraite (AST) de langages. Par exemple le langage OWL a plusieurs syntaxes dont une syntaxe fonctionnelle et une syntaxe RDF, de même que le langage ...

متن کامل

Inférence de règles de contrôle d'accès pour assurer la confidentialité des données au niveau des vues matérialisées. (Access control rules for materialized views : an inference-based approach)

HAL is a multi-disciplinary open access archive for the deposit and dissemination of scientific research documents, whether they are published or not. The documents may come from teaching and research institutions in France or abroad, or from public or private research centers. L’archive ouverte pluridisciplinaire HAL, est destinée au dépôt et à la diffusion de documents scientifiques de niveau...

متن کامل

Stratégies pour l'étiquetage et l'analyse syntaxique statistique de phénomènes difficiles en français : études de cas avec Talismane

RÉSUMÉ. Les outils statistiques robustes en TAL, tels que les étiqueteurs morphosyntaxiques et les analyseurs syntaxiques, utilisent souvent des descripteurs « pauvres », qui peuvent être appliqués facilement à n’importe quelle langue, mais ne prennent pas en compte les particularités de la langue. Dans cette étude, nous cherchons à améliorer l’analyse de deux phénomènes en français en injectan...

متن کامل

Règles de formation des noms en hausa (Formation rules of names in Hausa) [in French]

RÉSUMÉ____________________________________________________________________________________________________________ 
Dans la perspective du traitement automatique des langues africaines, nous avons décrit quelques caractéristiques du fonctionnement lexical du haoussa. Nous nous sommes intéressés aux règles de formation de mots à partir des racines où une racine est un mot auquel on ajoute quelqu...

متن کامل

Logiciel d'aide à l'étiquetage morpho-syntaxique de textes de spécialité

Résumé. La compréhension de textes de spécialité nécessite un étiquetage morpho-syntaxique de bonne qualité. Or, lorsque les textes étudiés sont issus de domaines spécifiques et peu usités, il est rare de disposer de dictionnaires et autres ressources lexicales fiables. Le logiciel que nous proposons permet d’utiliser un étiquetage réalisé par un étiqueteur généraliste, puis d’améliorer cet éti...

متن کامل

ذخیره در منابع من


  با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

عنوان ژورنال:
  • TAL

دوره 47  شماره 

صفحات  -

تاریخ انتشار 2006